تشخیص احساس انسان مبتنی بر همجوشی ویژگی های گفتار و حرکات چهره

پایان نامه
چکیده

در سالهای اخیر بازشناسی احساس به عنوان روش جدیدی برای تعامل انسان با کامپیوتر مورد توجه و موضوع تحقیقات زیادی بوده است. احساس، در قالب حرکات چهره، لحن و متن گفتار، حرکات دست و بدن و علایم زیستی مانند ضربان قلب بروز می یابد. تحقیقات موجود در حیطه بازشناسی احساس را می توان به سه گروه عمده تقسیم کرد. گروه اول، یکی از منابع مانند گفتار یا حرکات چهره را برای بازشناسی احساس استفاده می کنند. گروه دوم، نتیجه بازشناسی احساس با چندین منبع را در سطح تصمیم با هم ترکیب می کنند. گروه سوم ویژگی های استخراج شده از منابع مختلف را برای تولید ویژگی های مختلط با هم ادغام می کنند و با استفاده از ویژگی های جدید احساس را باز می شناسند. ترکیب سطح تصمیم، ارتباط بین ویژگی ها منابع مختلف را در نظر نمی گیرد. مثلا خشم و ترس علایم مشابهی در چهره دارند اما ویژگی های گفتاری آنها متفاوت است. انتظار ما این است که طبقه بندی که بر اساس ویژگی های گفتاری و چهره ای کار می کند؛ بتواند به شکل بهتری این دو احساس را از هم متمایز کند. از سویی دیگر، بررسی های روانشناسی نشان داده اند که علایم احساس در گفتار و چهره به صورت کاملا همزمان ظاهر نمی شوند. مثلا گره کردن ابروها هنگام وقوع احساس خشم، ممکن است اندکی قبل یا بعد از بالا رفتن تن صدا مشاهده شود. این ناهمزمانی، ترکیب و ادغام ویژگی ها را دچار مشکل می کند. مدل پیشنهادی در این رساله همجوشی اطلاعات گفتار و حالات چهره را در دو سطح ویژگی و تصمیم در نظر می گیرد. در این مدل، ویژگی های صوتی و تصویری در قالب سریهای زمانی استخراج می شوند. به منظور همزمان سازی آنها، بافرهای فعالی برای نگهداری مقادیر ویژگی ها و همجوشی زمانی آنها استفاده می شود. در زمان هایی که مقادیر ویژگی مورد نظر وجود داشته باشند؛ بافر با این مقادیر به روز می شود. در لحظات بعد اگر تا مدت معینی مقدار ویژگی موجود نباشد؛ مقدار موجود در بافرها به عنوان مقدار فعلی ویژگی گزارش می شود. پس از انقضای این مدت، مقادیر بافرها با مقادیر پیش فرض خاصی جایگزین می شوند. با استفاده از این بافرها، ویژگی های مختلف صوتی و تصویری همپوشانی زمانی مناسبی با هم پیدا می کنند. برای طبقه بندی احساس بروز یافته، سه نوع طبقه بند مبتنی بر ویژگی های گفتار، ویژگی های چهره و ویژگی های ادغام شده آنها یادگیری می شوند. سطح دوم همجوشی اطلاعات در مدل پیشنهادی، نتایج این طبقه بندها و همچنین نتیجه نهایی لحظه قبل را به صورت خطی با هم ترکیب می کند. مدل پیشنهادی با استفاده از دو پایگاه داده صوتی تصویری احساس enterface05 ( زبان انگلیسی، 42 نفر) و tmu-emodb (زبان فارسی، 12 نفر) آزمایش شده است. نتایج این آزمایش ها نشان دهنده این است که دقت بازشناسی احساس با ادغام ویژگی های ناهمزمان و ترکیب طبقه بندهای مبتنی بر ویژگی های ناهمزمان مشابه هم بوده و در حدود 40% برای پایگاه اول و 65% برای پایگاه دوم می باشند. در حالی که پس از همزمان سازی و ادغام ویژگی ها، میانگین دقت به 70% و 75% به ترتیب بر روی این دو پایگاه بدست آمده است. همچنین نتایج بدست آمده نشان میدهند که دقت بازشناسی با استفاده از ترکیب سه نوع طبقه بند فوق، برای پایگاه اول با دقت بدست آمده از طبقه بند مبتنی بر ویژگی های همزمان شده، تفاوت چندانی ندارد اما برای پایگاه دوم، این تفاوت از نظر آماری معنی دار است. نتایج فوق بیانگر افزایش دقت بازشناسی احساس با بکار بردن بافرهای همزمان سازی و ترکیب سه نوع طبقه بند فوق می باشند.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بهبود کیفیت گفتار مبتنی بر بهینه‌سازی ازدحام ذرات با استفاده از ویژگی های ماسک گذاری سیستم شنوائی انسان

چکیده: در این مقاله، روش‌های دوکاناله جدید زیرفضایی سیگنال با استفاده از تکنیک‌های حذف نویز ادراکی برای بهبود کیفیت سیگنال گفتار پیشنهاد شده‌اند. روش‌های پیشنهادی از مشخصات ماسک‌گذاری سیستم شنوایی انسان برای کاهش نویز باقی­مانده قابل­شنیدن بهره می‌گیرند. روش تجزیه به مقادیر منفرد کسری ادراکی، تکنیک بهینه‌سازی ذرات را برای تخمین نویز جمعی استفاده می‌کند. نتایج شبیه‌سازی دقیقی که توسط دو معیار مخ...

متن کامل

تشخیص احساس بر مبنای گفتار

تشخیص خودکار احساسات (aer) مساله ای بسیار مهم، در عرصه تعامل انسان و ماشین (hci) می باشد. با افزایش روزافزون محبوبیت کامپیوترها در زندگی ما، تحقیق درباره ی تعامل بین انسان ها (کاربران) و کامپیوترها نیز بیشتر مورد توجه قرار گرفته است. قابلیت تشخیص احساس توسط کامپیوترها با دقتی همانند انسان ، به منظور ایجاد رابطه ای طبیعی و دوستانه بین انسان و کامپیوتر، بسیار حائز اهمیت بوده و با مجهز شدن به چنین...

15 صفحه اول

تشخیص احساس ازسیگنال گفتار با استفاده از موجک بیونیک

تشخیص احساس برای رایانه امری چالش‌برانگیز است. دلیل اصلی این موضوع نیز عدم توانایی رایانه در درک احساس کاربر است. هدف از این مقاله، طراحی یک سیستم تشخیص احساس از گفتار و ارائة روشی نوین جهت بهبود این سیستم است. تاکنون در این زمینه از ویژگی‌های متفاوتی استفاده شده است، اما هیچ یک عملاً به ارتباط بین دامنة صوت و حالت‌های احساسی نپرداخته‌اند. چون موجک بیونیک به این ارتباط بیشتر پرداخته است، به‌نظر ...

متن کامل

تشخیص چهره انسان مبتنی بر تجمیع ویژگی های شکل ، رنگ و بافت از یک تصویر نمونه برای هر شخص

در سال های اخیر تکنولوژی هایی جهت بررسی هویت صحیح فرد مطرح شده که بر پایه فیلدی به نام بیومتریک استوار است. تکنولوژی های بیومتریک ، روش های خودکاری را برای بررسی و شناسایی هویت فرد ارائه می دهند که بر اساس مشخصات فیزیکی مانند اثر انگشت ، اسکن عنبیه چشم و تشخیص چهره به شناسایی فرد می پردازند .در 10 سال گذشته تشخیص چهره انسان به یکی از زمینه های تحقیقاتی فعال تبدیل شده است . علت این انگیزه نیز پت...

15 صفحه اول

تشخیص هویت انسان مبتنی بر همجوشی بیومتریک های کف دست و هندسه دست

امروزه تشخیص هویت فردی مبتنی بر سیستم های بیومتریک، نقش مهمی را در زندگی روزمره انسان ها ایفا می کند. از میان رویکردهای مبتنی بر شناسایی بیومتریک، روش های مبتنی بر بیومتریک دست توجه بسیاری را به خود جلب نموده اند. به طور کلی، سیستم های بیومتریک دست شامل دو دسته کلی هستند: بیومتریک های مبتنی بر هندسه دست و کف دست. از میان رویکردهای مبتنی بر کف دست، رویکردهای مبتنی بر بافت به دلیل دارا بودن ویژگی...

15 صفحه اول

تشخیص نوع احساس از روی گفتار با استفاده از ویژگی های زمان – فرکانسی

تشخیص احساس از روی سیگنال گفتار یکی از موضوعات جدید و چالش برانگیز در پردازش گفتار می باشد که نقش مهمی در ارتباط انسان و کامپیوتر دارد. استفاده از یک پایگاه داده جامع در سیستم تشخیص احساس از اهمیت زیادی برخوردار است. تاکنون پایگاه های داده مختلفی به زبان های آلمانی، انگلیسی، دانمارکی و سایر زبان ها ارائه شده اند اما پایگاه داده فارسی جامعی تاکنون مشاهده نشده است از این رو در این تحقیق پایگاه دا...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023